[レポート]生成AIのためのデータガバナンス入門 #ANT323
こんにちは。
リテールアプリ共創部のmogiです。
普段の業務ではクラスメソッドダナンやパートナー企業と共にアプリやWEB開発を行っており、プロジェクトマネージャーやスクラムマスターを担当しています。
今回、初めてre:Inventに参加させてもらっています。
昨今、生成AIの話題が盛んですが、その肝となるデータがどのように管理されるべきなのか知りませんでした。
私はエンジニア職ではないため、その方法についての知識が浅かったので、今回セッションで学んできました。
Amazon DataZoneとは
Amazon DataZoneは、企業のデータ管理を包括的にサポートするAWSのサービスです。企業内に散在する様々なデータを一元管理し、効率的な検索や発見を可能にするデータカタログ機能を提供します。また、メタデータの管理やデータの系統(データリネージ)を追跡することで、データの透明性を確保します。
セッション内容紹介(公式)
スピーカー
-
Durga Mishra
Principal Architect, AWS -
Praveen Kumar
Principal Analytics Solutions Architect, Amazon
内容
セッションではデータ管理の課題を整理して、Amazon DataZoneの機能の紹介と実際の使い方が説明されました。
また、実際のケースを元にどのようにデータを管理するか図を用いて表現して頂けたので、エンジニアでない私でも理解しやすかったです。
- データガバナンスの課題
- 構造化/非構造化データの管理
- データの発見可能性と共有
- セキュリティとコンプライアンスの確保
- データ品質の管理
- Amazon DataZoneの特徴
- データカタログ機能
- ビジネスメタデータの自動生成
- データガバナンス機能
- 部門間のデータ共有管理
- 非構造化データの管理
- 生成AIを活用したメタデータ生成
- 画像、PDF等の自動分析
- データ検索と発見可能性の向上
- セキュアなアクセス管理
- 実装例(保険会社のケース)
- マーケティングチームと営業チームの連携
- 住宅画像のリスク分析
- メタデータの自動生成
- データアクセス管理の自動化
- SageMaker Studio統合
- データ分析とAI/ML機能の統合
- ビジュアルなワークフロー構築
- 構造化/非構造化データの統合管理
- セキュリティとガバナンスの確保
アジェンダ
Amazon DataZoneの説明
実際の手書きの図を用いて説明
感想
正直なところエンジニアでない私が全てを理解するのは難しい内容でした。
ただ生成AIを利用するにあたって、データ管理の重要性やAmazon DataZoneをどのように利用すれば、それを実現することが出来るかの基本的なことは理解できました。
流行りの技術を利用するには、安全に利用するための技術の理解が必要です。
今後も自分のロールに関係なく、お客様に安全に価値提供できるよう技術の理解も続けていきたいです。